Sustitución de sesgo de recompensa: mitigaciones de sesgo de un solo eje redirigen la presión de optimización
<meta name=description content=Descubre cómo las mitigaciones de un solo eje redirigen la presión de optimización al sustituir el sesgo de recompensa. Clave para entender la alineación en IA.>